ENTREGA 3: Creación del dashboard o tablero de control.

El presente trabajo de análisis estadístico tiene como objetivo investigar una serie de variables que pueden explicar los factores de influencia en relación a la votación por el candidato Pedro Castillo de Perú Libre en la Segunda Vuelta Electoral de las últimas elecciones generales en Perú del 2021.

  1. modelos de asociación / correlación
  2. modelos de regresión/factorización
  3. modelos de clusterización
library(flexdashboard)
## Warning: package 'flexdashboard' was built under R version 4.3.2

Base unificada

library(rio)
midata=import("Base de datos_Unificada.xlsx")
str(midata)
## 'data.frame':    196 obs. of  11 variables:
##  $ Ubigeo        : num  10200 10300 10100 10400 10500 10600 10700 60200 60100 60300 ...
##  $ 
##  Provincia: chr  "BAGUA" "BONGARÁ" "CHACHAPOYAS" "CONDORCANQUI" ...
##  $ VOTOS         : num  24971 8374 15561 13060 12528 ...
##  $ POBLATOTAL    : num  98110 29335 58773 75888 50827 ...
##  $ POBLA_80      : num  1217 655 1362 175 1560 ...
##  $ IVIA          : num  52 51 40 69 58 59 53 65 45 71 ...
##  $ IDE           : num  64.9 71.6 76.7 40.9 70.5 ...
##  $ POBLAPOBRE    : num  34.8 33.2 22 56.8 48.1 ...
##  $ POBLAXPOBRE   : num  23.1 10.7 11.7 38.1 25 ...
##  $ POBLAOCU      : num  26886 11213 25569 8563 16076 ...
##  $ DEVENGADO     : num  5798 2107 19970 2652 3006 ...
summary(midata)
##      Ubigeo        \r\n Provincia        VOTOS           POBLATOTAL      
##  Min.   : 10100   Length:196         Min.   :    825   Min.   :    4997  
##  1st Qu.: 50775   Class :character   1st Qu.:   8796   1st Qu.:   31953  
##  Median :105600   Mode  :character   Median :  19866   Median :   67956  
##  Mean   :114595                      Mean   :  44654   Mean   :  175477  
##  3rd Qu.:170225                      3rd Qu.:  39756   3rd Qu.:  136629  
##  Max.   :250400                      Max.   :1938450   Max.   :10204814  
##     POBLA_80           IVIA            IDE          POBLAPOBRE    
##  Min.   :    32   Min.   :12.00   Min.   :40.88   Min.   : 3.106  
##  1st Qu.:   739   1st Qu.:37.75   1st Qu.:65.75   1st Qu.:21.970  
##  Median :  1330   Median :54.00   Median :69.74   Median :33.057  
##  Mean   :  3206   Mean   :49.71   Mean   :69.06   Mean   :32.027  
##  3rd Qu.:  2366   3rd Qu.:64.00   3rd Qu.:74.61   3rd Qu.:43.805  
##  Max.   :194084   Max.   :79.00   Max.   :83.32   Max.   :67.307  
##   POBLAXPOBRE          POBLAOCU         DEVENGADO    
##  Min.   : 0.00217   Min.   :    867   Min.   : 1519  
##  1st Qu.: 3.48562   1st Qu.:   9519   1st Qu.: 2812  
##  Median :11.98624   Median :  22456   Median : 3591  
##  Mean   :13.39464   Mean   :  67090   Mean   : 4527  
##  3rd Qu.:20.55554   3rd Qu.:  43788   3rd Qu.: 5661  
##  Max.   :48.66587   Max.   :4444364   Max.   :19970

Presentación de la base unificada

## Warning: package 'DT' was built under R version 4.3.2

Por un lado, en esta presentación se observa las variables de análisis en donde destaca la variable VOTOS, la cual representa a los votos obtenidos por provincia, del candidato Pedro Castillo. Por otro lado, aparecen las variables independientes: POBLAXPOBRE, la cual hace referencia a la población en condición pobre extremo; POBLAPOBRE, la cual refiere a la población en condición pobre; IVIA, la cual refiere al índice de inseguridad alimentaria; IDE, la cual refiere a la densidad del Estado; POBLAOCU, la cual refiere a la población ocupada; y, finalmente, DEVENGADO, la cual tiene que ver con el presupuesto devengado por provincia. Además, se coloca dos variables potenciales que pueden funcionar como variables de control: POBLATOTAL (población total) y POBLA_80 (población mayor de 80 años).

Gráfica de descripción de la variable central

df2 <- midata[, c(3:11)]  
row.names(df2)= midata$Provincia
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.3.2
ggplot(df2, aes(x = "", y = VOTOS)) +
  geom_boxplot(fill = "skyblue", color = "black") +
  ylim(0, 100000) +  # Establecer límites del eje y
  labs(title = "Diagrama de Cajas: Votos a favor de Pedro Castillo en segunda vuelta (Variable Central)", x = "Categoría", y = "Valor")
## Warning: Removed 17 rows containing non-finite values (`stat_boxplot()`).

Se observa que la concentración de votos a nivel provincial tiene un promedio bastante bajo. Sin embargo, se observa valores atípicos de mayor recurrencia en las grandes urbes: probablemente el valor atípico que se observa en la gráfica sea Lima por su densidad poblacional.

library(ggplot2)
library(plotly)
## Warning: package 'plotly' was built under R version 4.3.2
## 
## Attaching package: 'plotly'
## The following object is masked from 'package:ggplot2':
## 
##     last_plot
## The following object is masked from 'package:rio':
## 
##     export
## The following object is masked from 'package:stats':
## 
##     filter
## The following object is masked from 'package:graphics':
## 
##     layout
p1 <- ggplot(df2, aes(x = "", y = VOTOS, color = "")) +
  geom_boxplot(width = 0.9) + coord_flip(ylim = c(0, 200000)) +  # Ajustar el rango del eje y
  theme(legend.position = "top", axis.text.y = element_blank(), panel.background = element_rect(fill = "white", colour = "white")) +
  geom_jitter(shape = 16, position = position_jitter(0.2), size = 2) +  # Ajustar el tamaño de los puntos
  labs(title = "Votos totales de la Segunda Vuelta de Pedro Castillo", x = "", y = "Frecuencias", subtitle = "", caption = "ONPE")

# Convertir a plotly
ggplotly(p1)

Se observa que la concentración de votos a nivel provincial tiene un promedio bastante bajo. Sin embargo, se observa valores atípicos de mayor recurrencia en las grandes urbes: probablemente el valor atípico que se observa en la gráfica sea Lima por su densidad poblacional.

Modelo de correlación entre la variable dependiente e independientes

Correlación entre variables

library(ggcorrplot)
## Warning: package 'ggcorrplot' was built under R version 4.3.1
colNums=names(df2)
numXs=df2[,colNums]
ggcorrplot(cor(numXs),lab = T,show.diag = F)

Se observa una correlación bastante endeble en relación a algunas variables como POBLAPOBRE o POBLAXPOBRE, por ejemplo. Caso que puede contradecir ha algunas hipótesis que sostienen que las provincias más pobres votaron por el candidato Castillo.

Modelo de regresión lineal múltiple (Gauss)

Se opta por este modelo debido a que nuestra variable dependiente (VOTOS) ostenta un carácter numérico continuo. En esa línea, se plantearán tres modelos anidados que posteriormente serán comparados.

MODELO 1

Hipótesis: El número de votos a Pedro Castillo se encuentra influenciado por la cantidad de población pobre en cada provincia, controlado por la población total

modelo1=formula(VOTOS~POBLAPOBRE + POBLATOTAL)
reg1=lm(modelo1,data=midata)
summary(reg1)
## 
## Call:
## lm(formula = modelo1, data = midata)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -113804   -9398   -4640    5221  180556 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  1.793e+04  4.039e+03   4.438 1.52e-05 ***
## POBLAPOBRE  -2.112e+02  1.133e+02  -1.864   0.0638 .  
## POBLATOTAL   1.908e-01  2.222e-03  85.899  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 22920 on 193 degrees of freedom
## Multiple R-squared:  0.975,  Adjusted R-squared:  0.9747 
## F-statistic:  3760 on 2 and 193 DF,  p-value: < 2.2e-16
library(modelsummary)
model1=list('apropiacion (I)'=reg1)
modelsummary(model1, title = "Regresion: modelo 1",
             stars = TRUE,
             output = "kableExtra")
Regresion: modelo 1
 apropiacion (I)
(Intercept) 17927.844***
(4039.183)
POBLAPOBRE −211.157+
(113.252)
POBLATOTAL 0.191***
(0.002)
Num.Obs. 196
R2 0.975
R2 Adj. 0.975
AIC 4496.7
BIC 4509.8
Log.Lik. −2244.355
F 3760.140
RMSE 22739.32
+ p < 0.1, * p < 0.05, ** p < 0.01, *** p < 0.001

Al probar esta hipótesis vemos…

  1. La variable POBLAPOBRE tiene signo negativo, es decir, tiene una relaciòn inversa con la variable VOTOS.

  2. La magnitud del efecto de la variable POBLAPOBRE es de −211.157+ lo que indica cuànto varìa la variable dependiente cundo aumenta en una unidad controlado por la poblaciòn total.

  3. La variable POBLAPOBRE no es signficativa

MODELO 2

Hipotesis: El número de votos a Pedro Castillo se encuentra influenciado por la cantidad de población pobre y el Índice de Vulnerabilidad a la Inseguridad Alimentaria en cada provincia, controlado por la población total.

modelo2=formula(VOTOS~POBLAPOBRE+IVIA + POBLATOTAL)
reg2=lm(modelo2,data=midata)
summary(reg2)
## 
## Call:
## lm(formula = modelo2, data = midata)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -113479   -8632   -4226    5503  178657 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  2.377e+04  5.486e+03   4.334 2.36e-05 ***
## POBLAPOBRE   8.391e+01  2.194e+02   0.382    0.703    
## IVIA        -3.049e+02  1.944e+02  -1.568    0.118    
## POBLATOTAL   1.900e-01  2.272e-03  83.634  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 22830 on 192 degrees of freedom
## Multiple R-squared:  0.9753, Adjusted R-squared:  0.9749 
## F-statistic:  2527 on 3 and 192 DF,  p-value: < 2.2e-16
library(modelsummary)
model2=list('apropiacion (I)'=reg2)
modelsummary(model2, title = "Regresion: modelo 2",
             stars = TRUE,
             output = "kableExtra")
Regresion: modelo 2
 apropiacion (I)
(Intercept) 23774.663***
(5485.861)
POBLAPOBRE 83.914
(219.402)
IVIA −304.856
(194.408)
POBLATOTAL 0.190***
(0.002)
Num.Obs. 196
R2 0.975
R2 Adj. 0.975
AIC 4496.2
BIC 4512.6
Log.Lik. −2243.108
F 2526.530
RMSE 22595.09
+ p < 0.1, * p < 0.05, ** p < 0.01, *** p < 0.001

Concentràndonos en la variable IVIA al probar esta hipótesis vemos…

  1. La variable IVIA tiene signo negativo, es decir, tiene una relaciòn inversa con la variable VOTOS.

  2. La magnitud del efecto de la variable IVIA es de −304.856 lo que indica cuànto varìa la variable dependiente cundo aumenta en una unidad controlado por la poblaciòn total.

  3. La variable IVIA no es signficativa

COMPARACIÓN DE MODELOS

models=list('apropiacion (I)'=reg1,
            'apropiacion (II)'=reg2)
modelsummary(models, title = "Resultados de todos los modelos",
             stars = TRUE,
             output = "kableExtra")
Resultados de todos los modelos
 apropiacion (I)  apropiacion (II)
(Intercept) 17927.844*** 23774.663***
(4039.183) (5485.861)
POBLAPOBRE −211.157+ 83.914
(113.252) (219.402)
POBLATOTAL 0.191*** 0.190***
(0.002) (0.002)
IVIA −304.856
(194.408)
Num.Obs. 196 196
R2 0.975 0.975
R2 Adj. 0.975 0.975
AIC 4496.7 4496.2
BIC 4509.8 4512.6
Log.Lik. −2244.355 −2243.108
F 3760.140 2526.530
RMSE 22739.32 22595.09
+ p < 0.1, * p < 0.05, ** p < 0.01, *** p < 0.001
library(ggplot2)
library(sjPlot)
## Warning: package 'sjPlot' was built under R version 4.3.1
## #refugeeswelcome
plot_models(reg1,reg2,vline.color = "black",m.labels=c("Modelo 1","Modelo 2"),dot.size = 1,line.size = 0.6)

library(magrittr)
library(knitr)
tanova=anova(reg1,reg2)

kable(tanova,
      caption = "Tabla ANOVA para comparar modelos")%>%kableExtra::kable_styling(full_width = FALSE)
Tabla ANOVA para comparar modelos
Res.Df RSS Df Sum of Sq F Pr(>F)
193 101347016477 NA NA NA NA
192 100065446812 1 1281569664 2.459004 0.1184994

Anàlisis: es evidente que el modelo 2 es un mejor modelo que el modelo 1 con valor de AIC de 4496.2, el cual es menor al del otro modelo. Tambièn se constata que ambos modelos tienen un buen rango de explicaciòn mayor al 95%, sin embargo, se observa que tanto la variable POBLAPOBRE como la variable IVIA, pese a ser variables de expliaciòn de ìndices de calidad de vida, no son significativas para los modelos. Esto contradice la hipòtesis general y al entendimiento general de la sociedad sobre la idea de que los votantes de Pedro Castillo pertenecen al grupo de personas con menor calidad de vida,

CONGLOMERADOS

cor(midata[,c(3:11)])
##                   VOTOS POBLATOTAL    POBLA_80       IVIA        IDE
## VOTOS        1.00000000  0.9871816  0.98418231 -0.2390960  0.2300172
## POBLATOTAL   0.98718161  1.0000000  0.99800164 -0.2151396  0.2069641
## POBLA_80     0.98418231  0.9980016  1.00000000 -0.1997297  0.2129387
## IVIA        -0.23909600 -0.2151396 -0.19972966  1.0000000 -0.6229181
## IDE          0.23001723  0.2069641  0.21293871 -0.6229181  1.0000000
## POBLAPOBRE  -0.13549747 -0.1158965 -0.09776978  0.8568508 -0.4973409
## POBLAXPOBRE -0.15831506 -0.1426023 -0.12479963  0.7412856 -0.3770688
## POBLAOCU     0.98675868  0.9993913  0.99819215 -0.2141708  0.2097626
## DEVENGADO    0.06871857  0.0661369  0.07051456 -0.0920018  0.1992577
##              POBLAPOBRE POBLAXPOBRE    POBLAOCU   DEVENGADO
## VOTOS       -0.13549747 -0.15831506  0.98675868  0.06871857
## POBLATOTAL  -0.11589655 -0.14260231  0.99939128  0.06613690
## POBLA_80    -0.09776978 -0.12479963  0.99819215  0.07051456
## IVIA         0.85685082  0.74128565 -0.21417078 -0.09200180
## IDE         -0.49734089 -0.37706875  0.20976264  0.19925771
## POBLAPOBRE   1.00000000  0.83905031 -0.11849983 -0.17301722
## POBLAXPOBRE  0.83905031  1.00000000 -0.14401429 -0.06428243
## POBLAOCU    -0.11849983 -0.14401429  1.00000000  0.07240889
## DEVENGADO   -0.17301722 -0.06428243  0.07240889  1.00000000
dataClus=midata[,c(3:11)]
row.names(dataClus)=midata$Provincia
library(cluster)
## Warning: package 'cluster' was built under R version 4.3.2
g.dist = daisy(dataClus, metric="gower")

AGNES

Nùmero de clusters

library(factoextra)
## Warning: package 'factoextra' was built under R version 4.3.2
## Welcome! Want to learn more? See two factoextra-related books at https://goo.gl/ve3WBa
fviz_nbclust(dataClus, pam,diss=g.dist,method = "gap_stat",k.max = 10,verbose = F)

Se observa que el nùmero de clusters sugeridos para el anàlisis PAM es 1. Debido a que la clusterizaciòn no puede llevarse a cabo con un solo cluster, se emplearàn 3 como tentativa.

PAM

library(kableExtra)
## Warning: package 'kableExtra' was built under R version 4.3.2
set.seed(123)
res.pam=pam(g.dist,3,cluster.only = F)

#nueva columna
dataClus$pam=res.pam$cluster

# ver

head(dataClus,15)%>%kbl()%>%kable_styling()
VOTOS POBLATOTAL POBLA_80 IVIA IDE POBLAPOBRE POBLAXPOBRE POBLAOCU DEVENGADO pam
24971 98110 1217 52 64.92029 34.84303 23.06814 26886.463 5797.563 1
8374 29335 655 51 71.63909 33.24050 10.74025 11212.590 2106.738 2
15561 58773 1362 40 76.72790 22.02147 11.69852 25568.807 19969.544 2
13060 75888 175 69 40.88290 56.83160 38.14063 8563.138 2652.199 1
12528 50827 1560 58 70.52045 48.14855 24.99788 16076.254 3005.718 1
7739 33341 824 59 67.41977 33.21215 13.32772 12366.910 2988.584 1
36201 126719 1950 53 69.37494 29.89864 12.19684 42027.197 2640.640 2
39546 89995 1900 65 66.50604 52.59360 42.85749 24151.949 1955.310 1
131676 406186 6482 45 74.70071 33.68762 15.77103 132164.782 8241.849 2
31576 97950 2376 71 65.30679 57.93847 40.95297 27186.640 2151.772 1
66646 170514 5027 67 68.55375 58.11386 29.37011 49421.527 3614.310 1
8516 29641 1002 57 65.95108 45.35005 25.58486 9487.804 3290.277 1
42220 139778 3320 66 65.88736 57.50306 37.34836 41410.213 3186.720 1
41797 100019 2471 63 67.02878 51.93959 25.35182 28717.002 2289.258 1
72366 231137 3731 50 69.08823 39.36481 16.07615 76410.164 2806.103 2
install.packages("factoextra")
## Warning: package 'factoextra' is in use and will not be installed
library(factoextra)

fviz_silhouette(res.pam, print.summary = FALSE)

Provincias mal clusterizadas

silPAM=data.frame(res.pam$silinfo$widths)
silPAM$country=row.names(silPAM)
poorPAM=silPAM[silPAM$sil_width<0,'country']%>%sort()
poorPAM
## [1] "103" "108" "174" "6"

AGNES

Número de Clusters

fviz_nbclust(dataClus, hcut,diss=g.dist,method = "gap_stat",k.max = 10,verbose = F,hc_func = "agnes")

La estrategia aglomerativa de Agnes sugiere, de nuevo, un cluster para el anàlisis. Esto no es posible de graficar por lo que se emplearà el siguiente mejor nùmero de clusters, es decir, 2.

library(dplyr)
## Warning: package 'dplyr' was built under R version 4.3.1
## 
## Attaching package: 'dplyr'
## The following object is masked from 'package:kableExtra':
## 
##     group_rows
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(kableExtra)
set.seed(123)
library(factoextra)

res.agnes<- hcut(g.dist, k = 2,hc_func='agnes',hc_method = "ward.D")

dataClus$agnes=res.agnes$cluster

# ver

head(dataClus,15)%>%kbl()%>%kable_styling()
VOTOS POBLATOTAL POBLA_80 IVIA IDE POBLAPOBRE POBLAXPOBRE POBLAOCU DEVENGADO pam agnes
24971 98110 1217 52 64.92029 34.84303 23.06814 26886.463 5797.563 1 1
8374 29335 655 51 71.63909 33.24050 10.74025 11212.590 2106.738 2 1
15561 58773 1362 40 76.72790 22.02147 11.69852 25568.807 19969.544 2 2
13060 75888 175 69 40.88290 56.83160 38.14063 8563.138 2652.199 1 1
12528 50827 1560 58 70.52045 48.14855 24.99788 16076.254 3005.718 1 1
7739 33341 824 59 67.41977 33.21215 13.32772 12366.910 2988.584 1 1
36201 126719 1950 53 69.37494 29.89864 12.19684 42027.197 2640.640 2 1
39546 89995 1900 65 66.50604 52.59360 42.85749 24151.949 1955.310 1 1
131676 406186 6482 45 74.70071 33.68762 15.77103 132164.782 8241.849 2 1
31576 97950 2376 71 65.30679 57.93847 40.95297 27186.640 2151.772 1 1
66646 170514 5027 67 68.55375 58.11386 29.37011 49421.527 3614.310 1 1
8516 29641 1002 57 65.95108 45.35005 25.58486 9487.804 3290.277 1 1
42220 139778 3320 66 65.88736 57.50306 37.34836 41410.213 3186.720 1 1
41797 100019 2471 63 67.02878 51.93959 25.35182 28717.002 2289.258 1 1
72366 231137 3731 50 69.08823 39.36481 16.07615 76410.164 2806.103 2 1
# Visualize
fviz_dend(res.agnes, cex = 0.7, horiz = T,main = "")
## Warning: The `<scale>` argument of `guides()` cannot be `FALSE`. Use "none" instead as
## of ggplot2 3.3.4.
## ℹ The deprecated feature was likely used in the factoextra package.
##   Please report the issue at <https://github.com/kassambara/factoextra/issues>.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.

fviz_silhouette(res.agnes,print.summary = F)

-Pronvincias mal clusterizadas

silAGNES=data.frame(res.agnes$silinfo$widths)
silAGNES$country=row.names(silAGNES)
poorAGNES=silAGNES[silAGNES$sil_width<0,'country']%>%sort()
poorAGNES
## [1] "115" "157" "193" "34"  "68"  "99"

DIANA

Nùmero de clusters

fviz_nbclust(dataClus, hcut,diss=g.dist,method = "gap_stat",k.max = 10,verbose = F,hc_func = "diana")

El nùmero de clsuters sugeridos por el algoritmo Diana es 1, sin embargo, no e sposible realizar el anàlisis de esa forma por lo que se tomarà en cuenta el siguiente mejor nùmero sugerido que es 3.

set.seed(123)
res.diana <- hcut(g.dist, k = 3,hc_func='diana')
dataClus$diana=res.diana$cluster
# veamos
head(dataClus,15)%>%kbl%>%kable_styling()
VOTOS POBLATOTAL POBLA_80 IVIA IDE POBLAPOBRE POBLAXPOBRE POBLAOCU DEVENGADO pam agnes diana
24971 98110 1217 52 64.92029 34.84303 23.06814 26886.463 5797.563 1 1 1
8374 29335 655 51 71.63909 33.24050 10.74025 11212.590 2106.738 2 1 1
15561 58773 1362 40 76.72790 22.02147 11.69852 25568.807 19969.544 2 2 2
13060 75888 175 69 40.88290 56.83160 38.14063 8563.138 2652.199 1 1 1
12528 50827 1560 58 70.52045 48.14855 24.99788 16076.254 3005.718 1 1 1
7739 33341 824 59 67.41977 33.21215 13.32772 12366.910 2988.584 1 1 1
36201 126719 1950 53 69.37494 29.89864 12.19684 42027.197 2640.640 2 1 1
39546 89995 1900 65 66.50604 52.59360 42.85749 24151.949 1955.310 1 1 1
131676 406186 6482 45 74.70071 33.68762 15.77103 132164.782 8241.849 2 1 2
31576 97950 2376 71 65.30679 57.93847 40.95297 27186.640 2151.772 1 1 1
66646 170514 5027 67 68.55375 58.11386 29.37011 49421.527 3614.310 1 1 1
8516 29641 1002 57 65.95108 45.35005 25.58486 9487.804 3290.277 1 1 1
42220 139778 3320 66 65.88736 57.50306 37.34836 41410.213 3186.720 1 1 1
41797 100019 2471 63 67.02878 51.93959 25.35182 28717.002 2289.258 1 1 1
72366 231137 3731 50 69.08823 39.36481 16.07615 76410.164 2806.103 2 1 1
fviz_silhouette(res.diana,print.summary = F)

Anàlisis: en definitiva, los datos presentados no son ùtiles o aptos para realizar un anàlisis de conglomerados ya que en todos los procesos de clusterizados el resultado es 1. Esto significa que las variables presentadas no pueden ser agrupadas en diversos clusters por su gran distancia y poca similitud. A pesar de ello, ignorando el nùmeros de clusters sugeridos en cada algoritmo, se realizò la clusterizaciòn y se obtuvo como mejor estrategia la de Pam ya que presenta menor nùmero de datos mal clusterizados.